1
シーケンシャルな限界を越えて
AI032Lesson 10
00:00

'無料ランチ'の終わり

数十年にわたり、開発者は「シーケンシャルな限界」と呼ばれる時代を享受してきました。この時代は デンナードスケーリング すべての新しいチップ世代でより高速なクロック速度が得られることを保証していました。しかし、私たちが直面したのは パワーウォールです。性能は周波数の関数ではなくなりました。それは 同時実行性の関数となりました。前進するためには、 計算的思考 を用いて、抽象的な 数値的手法 と現代の 並列実行モデルの間のギャップを埋める必要があります。

精度と性能のトレードオフ

ある ドメイン問題 (例:分子動力学)を マルチコアホスト から CUDAデバイス に移行することは、単なる構文の変更を超えます。それは 問題分解の変化です。並列化を行う際には、演算順序を頻繁に変更します。浮動小数点演算は結合則が成り立たないため、以下のトレードオフに直面します: 浮動小数点の精度と正確さ。並列処理の結果は数学的には正当でも、逐次処理の祖先とは数値的に異なる可能性があります。

シーケンシャルな限界クロック速度の限界並列高速道路CUDAのスループット計算的思考の橋渡し
main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>